max rank | avg. rank | sentence |
---|---|---|
300 | 134.2222 | W 2006 roku zamieszkiwało ją ok. 2 tys. mieszkańców. |
430 | 179.2667 | Według danych na rok 1990 gminę zamieszkiwało 21 osób, a gęstość zaludnienia wynosiła 1 osób/km². |
460 | 255.6667 | Po zakończeniu sezonu został bez klubu. |
464 | 161.1111 | Od marca 1945 wieś znajduje się ponownie w Polsce. |
487 | 215.4444 | W 2001 r. miasto to zamieszkiwało 21 000 osób. |
601 | 307.3333 | Pierwszy kościół powstał w XVIII wieku. |
646 | 293.8571 | W drugiej lidze występował do 1991 roku. |
646 | 240.4000 | W pierwszym sezonie w pierwszej lidze klub zajął 7 miejsce. |
646 | 198.6000 | W tym samym czasie w lidze klub zajął 12 miejsce. |
666 | 234.0000 | Do Polski powrócił dopiero w 1981 roku. |
733 | 227.2500 | Według danych z 2011 r. liczyła 40 mieszkańców. |
745 | 253.1429 | W 2006 zamieszkiwało ją 14 200 mieszkańców. |
746 | 400.1667 | W październiku powrócił do Wielkiej Brytanii. |
755 | 269.7143 | W jego barwach zadebiutował w 1944 roku. |
755 | 240.1250 | W jego barwach zakończył karierę pod koniec roku. |
832 | 312.2222 | Do walk doszło tam także w 1941 i 1944. |
842 | 242.0000 | W 2005 roku zakończył w tym klubie swoją karierę. |
842 | 324.0833 | W klubie tym grał do końca swojej kariery, czyli do 1973 roku. |
889 | 350.3750 | Przez rok w jego barwach rozegrał 12 spotkań. |
912 | 267.0000 | Już w wieku 20 lat zdobył pierwszy tytuł mistrza kraju. |
938 | 413.0000 | W sierpniu zdobył pierwsze punkty w sezonie 1984. |
939 | 446.3333 | W całym sezonie rozegrał w barwach klubu 23 spotkania. |
942 | 328.3333 | W sierpniu 1945 roku wrócił z Anglii do kraju. |
954 | 589.0000 | Dla drużyny narodowej rozegrał ponad 100 spotkań. |
956 | 406.7500 | Na nowo stała się siedzibą parafii w 1997. |
1027 | 414.1667 | W listopadzie 1939 powrócił do Warszawy. |
1031 | 233.0000 | Był to już jednak koniec istnienia zespołu. |
1057 | 299.3750 | W sezonie 2005 2006 grał w pierwszym zespole. |
1072 | 347.2500 | Pierwszy w wojskowych mistrzostwach świata w 1983 roku. |
1077 | 333.0000 | W marcu 2017 roku zdobył także mistrzostwo kraju w tej konkurencji. |
The maximum word rank of a sentence is by definition the rank of the rarest word in the sentence. If it is low, all words in the sentence are of high frequency. For this reason the table of the sentences with least maximum word number might be of interest. In the table, we see the corresponding sentences with a minimum length of 40 characters.
The over all distribution of the maximum rank in all sentences of the corpus is shown in a diagram with log-scaled x-axis.
The sentences in the table described above are of interest because they are usually easy to understand. The distribution may give insights into the corpus and may give parameters for language comparison.
While the distribution might be deduced from a small corpus, the sentences in the table are rare and a large corpus will give more impressive results.
Table data:
select max(w_id)-100 as m, avg(w_id)-100 as a, s.sentence from sentences s, inv_w i where s.s_id=i.s_id and length(sentence)>40 and i.w_id>100 group by s.s_id order by m limit 30;
Distribution data;
select m, count(*) from (select 100* round((max(w_id)-100)/100) as m from sentences s, inv_w i where s.s_id=i.s_id and i.w_id>100 group by s.s_id) aa group by m;
Explain the distribution, especially the increase in its right part.
4.5.2.2 Average word rank in sentence
4.5.2.3 Sentences consisting of many low frequency words I
4.5.2.4 Sentences consisting of many low frequency words II
4.5.2.5 Sentences consisting of short words only I
4.5.2.6 Sentences consisting of short words only II
4.5.2.7 Sentences consisting of long words only I
4.5.2.8 Sentences consisting of long words only II